我們今天用 sagemaker studio 去學習如何建立一個 ML 專案,
SageMaker Studio 是 AWS 提供的整合式機器學習開發環境,它將資料準備、模型訓練、部署等所有 ML 流程整合在一個平台上
所以對於像我這樣的初學者來說是相對比較好上手的
SageMaker Studio 是一個基於 JupyterLab 的網頁版 IDE,專為機器學習工作流程設計
功能與特色
一般來說我們到 aws console 輸入 sageMaker sutdio 然後點擊進入頁面就可以看到,長這樣
然後通常對於 aws 服務來說,要開始專案,跟著橘色的按鈕走普遍來說沒有錯
點擊 『Create a sageMaker Domain』
這時候會看到上圖的東西,
這時候如果你沒有設置 vpc 記得去左上角搜尋 vpc
創建一個 vpc 網路空間
有 vpc 後點選 setup
按鈕,就會幫你快速設定,會要等一段時間...
點擊『Open studio』(如圖)
如果看到這個頁面就算成功了
這時候熟悉 jupter notbook 基本上介面是差不多的
# 導入必要的套件
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import sagemaker
from sagemaker.sklearn.estimator import SKLearn
import boto3
# 設定 SageMaker session
sagemaker_session = sagemaker.Session()
role = sagemaker.get_execution_role()
bucket = sagemaker_session.default_bucket()
print(f"SageMaker role: {role}")
print(f"S3 bucket: {bucket}")
很多人可能擔心使用 aws 會衍生出其他費用,有可能只是好奇 sagemaker 的創建和使用所以沒用到要刪除
刪除基本上要注意幾點
記得把 running instance active 相關的給停掉,目前只開一個的話應該很好發現
這個在 Admin configurations (左邊的導覽列中) -> Domain ->
這時候會看到自己的 Domain 優先把 space management, user profile 的內容刪除
這時候就可以刪除 Domain 了
移除 project file
基本上這個位置在 s3 所以要去 s3 看 sagemakder studio 產生出來的 bucket 這時候可以把該 bucket 刪除
刪除相關服務
像是 vpc, EFS volumes 等等這些都去檢查一下要刪除
打完收工!